在
DirectX 11时代,为进一步加强通用可编程化能力,
NVIDIA将GPU划分为多个GPC模块,每个模块实际上除了没有独立的
显示存储器控制器、
二级高速缓存以外,几乎是一颗完整的小型GPU。在GPC内部,自带光栅单元、SM(流式
多处理器)数组/单元,SM单元中包含了一个指令
高速缓存、Warp
调度程序和分派单元各两个、
寄存器、32个/48个
流处理器(
CUDA核心)、16个加载/
存储单元、4个
特殊功能单元、一级高速缓存、4个纹理单元、纹理高速缓存以及一个负责
曲面细分的PolyMorph引擎。
通过对GPC单元或SM数组的增加删减,性能会随之成近乎线性的增减,籍此可以快速产生多个不同的GPU产品线。顶级产品GeForce GTX 480上,
显示核心代号‘
GF100’,共计4组GPC单元,每组4个SM数组,每个SM数组32个流处理器,但其中一组SM数组被关闭。中高端产品GeForce GTX 460,
核心代号‘GF104’,拥有2组GPC单元,每组4个SM数组,但每个SM数组中有48个流处理器,同样有一个SM数组被关闭。
Tessellation技术已经被编入为DirectX 11标准。对手
AMD则在
Radeon 8500时代已经支持
相关技术。但当时的Tessellation级别不能够被
有效控制,容易造成图像有损。现时,Tessellation技术已经可以完全被编程。额外的顶点可以通过不同的算法而新增。
Direct Compute可以加强图形特效。例如不同对象的半透明效果,
景深效果。
由于应用了Tessellation技术,场景中的
多边形数量可能会大幅增加。PolyMorph引擎则用来增强多多边形场景的几何性能。
亦即是NVIDIA所称的CUDA核心。所有指令都被打散为1D指令。增加CUDA核心的
使用率。数据只在输出时
四舍五入。以往的做法是每一个步骤都要四舍五入,误差会累积。整数指令精度方面,支持32位,而对手AMD则只支持24位。在运行殊函数运算时,AMD的
显示核心使用流处理器仍计算。而NVIDIA的显示核心则采用专用的组件。
德国同行从可靠渠道那里获得了GF104核心新卡GeForce GTX 460的最终详细规格,包括两个不同版本,甚至还得到了一些最新性能数据。GF104核心完整集成384个流处理器,但GTX 460只启用了336个,同时拥有56个纹理单元(等同于GTX 470),并且根据
显存位宽、容量的不同分为两个版本:其一位宽256-bit,容量1GB
GDDR5,带宽115.2GB/s;其二位宽192-bit,容量768MB GDDR5,带宽86.4GB/s。 不过两个版本的频率设置是完全相同的,都是核心675MHz、流处理器1350MHz、显存1800MHz(等效3600MHz),
纹理填充率也均为378亿每秒。
性能方面,GTX 460 768MB运行
3DMark Vantage Extreme可以得到X6000分左右,和我们早先得到的情报完全符合,另外样品不加压的话
核心频率可以轻松超至830MHz,略微加压后则能提高到900MHz左右,测试得分也升至X8000分左右,而价格更贵的GTX 470只有X7650分左右。显然,新的GF104核心虽然规模削弱了,但是体质更好,超频潜力也更大。
如果说上半年HD5000系列是一条得水的鱼,那么下半年GTX 460发布则是抽
干水的水泵。GTX460在2010年7月12日发布,根据显存配置不同而分为两种型号,其中256-bit 1GB GDDR5的价格为229美元,192-bit 768MB GDDR5的则是199美元,除了显存位宽和容量不同,GTX 460两款型号都会集成336个流处理器,核心/流处理器/
显存频率分别为675MHz/1350Mhz/3600Mhz。 GTX460的确是NVIDIA为游戏玩家设计的一款接近完美产品,其性能足以在
全高清分辨率下流畅运行当今几乎所有的主流游戏,包括大多数DX11游戏;专为DX11
优化设计的强大曲面细分和几何性能,也足以应付日后即将发布的DX11游戏;优秀的功耗控制也不会让游戏玩家在空闲时浪费太多的电能,较低发热和噪音可以轻松度过炎炎夏日;最重要的是厚道的价格让玩家们可以无需等待就能出手享用。另外GTX 460在无需加压情况下就可将核心频率轻松超至800MHz。